Model Selection

High-precision action recognition

# High-precision action recognition

Videomae Base Finetuned Kinetics Violence Nonviolence Tuned

A video classification model based on the VideoMAE architecture, specifically fine-tuned for violence and non-violence scene classification tasks

Video Processing

Xclip Large Patch14 Kinetics 600

X-CLIP is an extended version of CLIP for general video-language understanding, trained on video-text pairs through contrastive learning.

Transformers English

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase